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Введение 


В последние годы широкое распространение получила многооперандная обра- 
ботка потока данных, в основе которой лежит свёртка многорядных бинарных кодов 
(МРК) с помощью многооперандных сумматоров [1], [2]. 
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Особенности свёртки кодов при построении умножителей... 


Свёртка МРК используется и при аппаратной реализации схемы «школьного» 
умножения двух двоичных сомножителей. Совокупность строк (частичных произве- 
дений) образует при одинаковой разрядности сомножителей ромб бит частичных 
произведений (БЧП), который может быть интерпретирован как МРК. Тогда про- 
изведение получается как результат свёртки ромба БЧП. Однако такая свёртка за один 
операционный цикл при большой разрядности сомножителей нереализуема из-за высо- 
ких затрат оборудования, поэтому на практике прибегают к декомпозиции исходного 
ромба БЧП. В [3] предложен метод построения быстродействующего умножителя, осно- 
ванный на декомпозиции ромба БЧП на одинаковые подромбы, для аппаратной реали- 
зации которых используются специализированные сумматоры типа ромб. Однако в [3] 
не решён вопрос построения вырожденных сумматоров. 

Постановка задачи исследования. Требуется доработать метод ромбов и предло- 
жить новые схемотехнические решения при построении умножителей с целью повыше- 
ния их быстродействия. 


Построение быстродействующих умножителей 
методом ромбов 


Предложенный в [3] метод включает в себя: 

1) декомпозицию ромба БЧП на 4 подромба половинной размерности; 

2) использование для обработки подромбов сумматоров типа ромб; 

3) свёртку результатов предыдущего этапа суммирования с помощью трёхопе- 
рандного сумматора (ТОС) [4]. 

Этот метод иллюстрируется примером схемы умножения 16х16 (рис. 1). Какив [3], 
исходный ромб БЧП разбивается на 4 одинаковых подромба двумя сечениями, гори- 
зонтальным и наклонным, параллельными границе исходного ромба. Выделены 4 
подромба, которые являются фрагментами 8х8 исходного ромба БЧП; они пронуме- 
рованы от 1 до 4. Эти фрагменты могут быть далее разбиты на более мелкие подромбы 
размером 4х4 (показано на примере подромба 1). Значком «х» обозначены биты опе- 
рандов, биты ромба БЧП, биты результатов свёртки подромбов 1..4, а также биты 
результата перемножения. Кроме того, выделен формат результирующего суммиро- 
вания, в котором показано количество слагаемых в данном разряде. Пунктиром от- 
мечены разряды, в которые возможен перенос. 


ХХ ххКХХЯХХХ А 
х 
В 


1 
2 
суммы 3з 
4 


3332222222222111111111100000 разряды 
2109875543210987654321098755 


результат 
Рисунок 1 — Схема умножения 16х16 с покрытием ромбами 
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Каждый подромб бит обрабатывается своим сумматором типа ромб, который вы- 
даёт однорядный результат. Для свёртки исходного ромба БЧП нужно предварительно 
свернуть каждый отдельный подромб, а для свёртки подромба минимального размера 
необходимо иметь (построить) сумматор типа ромб со следующим распределением бит 
слагаемых по разрядам [1234321]. 

Рассмотрение формата результирующего суммирования показывает, что первые 
8 однобитовых разрядов идут непосредственно на выход в качестве готового результа- 
та, следующие 16 трёхбитовых разрядов должны быть обработаны ТОС, и старшие 8 
разрядов — вновь однобитовые. Обработка последних имеет особенности, поскольку из 
двадцать четвёртого разряда возможен двухбитовый непозиционный перенос. Здесь воз- 
можны 2 варианта обработки старших п/2 разрядов: 1) использование модифицирован- 
ного условного переноса для управления выбором заготовленных результатов обработки 
этих разрядов вырожденными сумматорами; 2) неявный учёт переноса при включении 
этих разрядов в общую разрядность ТОС, в результате чего она возрастает в 1,5 раза. 

Из рассмотрения рис. | следует, что форматы результатов обработки подромбов 
(разряды с девятого по двадцать четвёртый) составляют трёхрядный код. Аналогичное 
положение будет и в общем случае, что устанавливает 

Теорема. При покрытии ромба БЧП, полученного умножением АхВ разрялд- 
ностью ихи, четырьмя одинаковыми подромбами результаты суммирования их бит 
выстраиваются в 3 ряда кодов разрядностью и. 

Доказательство. Предварительно определим некоторые понятия. Назовём длиной 
формата результата его количество бит с учётом бита переноса; сдвигом данного 
формата относительно формата результата обработки 1-го ромба назовём расстояние, 
измеряемое количеством бит между первыми битами данного формата и формата 1-го 
результата. 

Далее рассмотрим форматы результатов при суммировании бит ромба, вклю- 
чающего в себя 4 подромба размерностью и/2хи/2. Сомножители А и В выражаются 
через половинные форматы, то есть в результате перемножения получим АхВ= 
=А1хВ1 + А2хВТ + А2хВ1 + А2хВ2. Каждому слагаемому этого выражения со- 
ответствует свой ромб (1, 2, Зи 4-й - рис. 1). Длина формата каждого результата с 
учётом возможного переноса из ромба равна и, поскольку перемножаются сомножители 
одинаковой разрядности и/2. Очевидно, сдвиги форматов результатов перемножения 
А1ХхВ?2 и А2хВ1 одинаковы и равны и/2, а сдвиг формата результата перемножения А2хВ2 
равен и. Таким образом, начиная с (и/2+1)-й позиции по (и+и/2)-ю позицию (длина равна п) 
необходимо суммировать 3 слагаемых, то есть результаты обработки всех подромбов 
действительно образуют трёхрядный код. 

Следствие. При переходе от данной размерности подромба к вдвое большей 
размерности при сборке результатов обработки новых подромбов также образуется 
трёхрядный код. 

Теорема и следствие из неё обосновывают применение ТОС разрядности и при 
построении умножителей на основе сумматоров типа ромб. 

В общем случае процедура свёртки ромба БЧП на основе метода ромбов вклю- 
чает в себя несколько этапов; на каждом этапе к полученным подромбам также 
может быть рекурсивно применена декомпозиция на 4 одинаковых подромба поло- 
винной размерности. Размерность наименьшего подромба составляет 3х3, 4х4 или 
5х5. Таким образом, размерность сомножителей должна выбираться по формуле: и = 
т2^, где т = 3, 4, 5, ак— глубина рекурсии при декомпозиции исходного ромба БЧП, 
2 
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На каждом этапе обработки, начиная со второго, осуществляется свёртка 3—1 
с помощью ТОС. 

Наименьшие подромбы обрабатываются одинаковыми сумматорами типа ромб. 
Для описания сумматоров разработана программа, позволяющая получить его таблицу 
функционирования (ТФ) по заданному распределению бит слагаемых по разрядам. 
Так, для сумматора, обрабатывающего ромб бит размерностью 4х4, построена ТФ [3] с 
распределением [1 23432 1]. Аналогично могут быть построены ТФ сумматоров 
типа ромб для размерности 3ХЗ и 5х5. ТФ заполняются разрядными индексами 
симметрических функций (СФ) [5], причём индексы СФ вычисляются упомянутой 
программой. 

На рис. 2 показана структура умножителя 16х16, построенного в соответствии 
с предложенным методом. Здесь обозначено: И — линейка из и’ элементов И, реали- 
зующих конъюнкцию бит сомножителей с,=аф, 1, ] =1..п; С_Р — линейка сумматоров 
типа ромб, в обозначении которых первая цифра — номер подромба 8х%8, а вторая — 
номер подромба 4х4; далее — двухранговая пирамида из ТОС. 


Рисунок 2 — Структура умножителя 16х16 по методу ромба 


Суммирование всех бит БЧП проходит в 3 этапа: на первом этапе на сумматорах 
типа ромб суммируются биты «малых» ромбов, на втором этапе — на ТОС суммируются 
биты подромба, составленного из 4-х малых подромбов, а на последнем, третьем этапе, — 
на ТОС суммируются результаты предыдущего этапа. Таким образом, при предложен- 
ном подходе осуществляется свёртка 16—>9—3—1. 


Обработка старших разрядов 


Отметим, что при обработке старших восьми разрядов (рис. 1) возможен непо- 
зиционный перенос из ТОС 16.3, который может быть учтён вырожденным суммато- 
ром с одним операндом и несколькими битами переноса. Необходимость использования 
вырожденных сумматоров возникает и в общем случае. 

Рассмотрим на примере умножителя 8х8 два варианта обработки старших разрядов: 
использование модифицированного условного переноса и расширение разрядности ТОС. 

1. Описанный в [6] условный перенос нами модифицирован применительно к 
данному случаю: двухбитовый непозиционный перенос Гласера (С и С’) из ТОС 8х3 
управляет коммутатором для выбора из трёх заготовленных результатов. 
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Отметим, что при сложении трёх операндов невозможен одновременный по- 
зиционный перенос в следующий разряд и через разряд, т.е. Р.&Р>=0. Это означает, 
что можно чётко разграничить ситуации с различными вариантами позиционных 
переносов: либо нет переносов (СС?” = 00), либо есть перенос в следующий разряд 
(СС’=10), либо есть перенос через разряд (СС” = 11). Связь непозиционного переноса 
Гласера и позиционного переноса задаётся следующими выражениями: Р. = С!С’, Р› 
= СС’ (! означает инверсию переменной). 

Коммутатор выбирает один из трёх результатов, полученных при обработке 
данных со следующими форматами: при отсутствия переноса из ТОС - это формат 
самой старшей тетрады [1 1 1 1]; в случае наличия переноса из ТОС — форматы 
входных данных для вырожденных сумматоров имеют вид [1 112] и [112 1] при 
СС’ = 10 и СС” = 11 соответственно. 

В первом случае результат обработки тетрады повторяет исходную тетраду — 
разряды с 13-го по 16-й передаются сразу на выход умножителя, во втором и третьем 
случаях вырожденные сумматоры одновременно подготавливают результаты до 
вычисления значений СС’ на выходе ТОС. Описание функционирования вырожден- 
ных сумматоров приведено в табл. | и 2; они построены с помощью упомянутой 
выше программы. 


Таблица 1 — РИ для сумматора [1 112], Р.=1 


2. Включение старшей тетрады в процесс обработки ТОС, что расширяет его 
разрядность в 1,5 раза. Особенность этого случая состоит в том, что при этом разряд- 
ность может превысить 16, 64, а это определяет необходимость в построении сле- 
дующего яруса схем параллельного переноса ТОС. 


Сравнение реализаций 


1. В случае использования условного переноса дополнительная задержка оп- 
ределяется операцией выбора нужного результата из трёх заготовленных и равна {оп 
= [ом=Зт, ГДе ом — задержка коммутатора, т — задержка вентиля. 

В случае включения старшей тетрады в процесс обработки ТОС возможны два 
варианта: увеличенная разрядность не превысит / превысит значение 16 или 64. В первом 
варианте дополнительная задержка не возникнет, а во втором варианте составит и = 2%. 


182 «Искусственный интеллект» 32012 


Особенности свёртки кодов при построении умножителей... 3 п 


2. Лучшее решение по быстродействию для обработки старшей тетрады заклю- 
чается в использовании ТОС с расширенной в 1,5 раза разрядностью. Однако, как показал 
анализ, это решение требует больших дополнительных аппаратных затрат. Выбор вариан- 
та обработки старших разрядов лежит на проектировщике умножителя. 


Заключение 


Достоинством предложенного метода построения умножителя является регуляр- 
ность его структуры. Так, собрав 4 умножителя 8х8 в общую структуру, получим умно- 
житель 16х16; 4 умножителя 16х16 дадут умножитель 32х32, и т.д. Недостатком метода 
является то, что допустимые разрядности сомножителей ограничены рядом значений 3.2% 
4.2", 5-2^, где К =1, 2... 

Сформулирована и доказана теорема о трёх рядах кодов, в которые выстраиваются 
результаты обработки подромбов; эти ряды могут быть далее обработаны трёхоперанд- 
ным сумматором. Количество ярусов г пирамиды ТОС равно глубине К рекурсии при 
декомпозиции исходного ромба БЧП: 7=К. 

Для обработки старших разрядов предложены 2 варианта решения: 

1) использование модифицированного условного переноса на основе вырожден- 
ных сумматоров; 

2) расширение разрядности ТОС в 1,5 раза за счёт включении старших разрядов в 
общую разрядность ТОС. Наилучшим в смысле минимума задержки является пос- 
ледний вариант, однако для его реализации нужны большие аппаратные затраты. 

Для схемотехнической реализации умножителя могут быть использованы програм- 
мируемые логические матрицы (ПЛМ или ПМЛ), а также матричные кристаллы (БМК). 
ПЛМ (ИМЛ) проигрывают по быстродействию БМК, но у последних — проблемы с нагру- 
зочной способностью элементов, а это в значительной мере ослабляет преимущество БМК. 
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КЕЗОМЕ 
О.М. Раийп 


Реашигеу ор Со4е; Сотргез;уте Бу еяептте 
ор МширПегу оп Фе Вазе ор те Кйотиу Метоа 


Тре агасе 1$ сопсегпей \и Фе ргеззте рго ет оЁ десгеазе оЁ пи!арПегз а@ау. 
Ш Фе агафе Юпищаноп оЁ Фе фотби$ шефод 15$ оЁегеа, \ысьЬ 1$ 4езсгфе4 ш Ше 
агас]е оЁ Ше зате аифог "Оп ОБезюптше Фе Миарйег Вазед оп Фе КВотби$ Туре 
Аа9ег", т Фе ]оигпа| “Агяйсла! пеШеоепсе”, 472006. ш фе те#о4 а тпотБи$ оЁ рагйа1 
ргодисЕ Б1{$ 15 Чту14еа шю зибтВотБи$ез оЁ (усе 1ез5 Аптепз1оп Ь1 5, апа Гиифег Феу аге 
орегже4 оп отриз-ПКе ад4ег$. т Ше ргезепе агасе Бу Ше ехатре оЁ 8х8 шшарПег 
Фе Геаоге$ оЁ сотргез$ те оЁ плз 61$ ОЕ заттаЫе зетез оЁ содез, \мшсВ аге Фе гезий( оЁ 
сотргез$ те оЁТоиг 4х4 аппеп$1юоп за ПотЬи$е$ оЁ БИ, аге сопз14егед. 

А Шеогет Фаё аЁ гесигзлуе десотроз!оп оЁ Фе гези $ оЁ сотргезут» оЁ Юг 
за потби$ез оЁ 61$ оЁ Ше ргеу1ои$ ргосеззте (асе (шуааПу Фае 1$ а потби$ о{ рага1 
ргоЧисЕ 615$) @гее го\уз оЁ Фе со4ез аге Гюгтеа, 15 Гогпч]ае4 ап4 ргоуеа, фа Гоипде$ 
Фе изасе оЁ а @гее-орегап4 аа4ег 11 Фе згасаге оР ихи ши!арПег. 

Тре ГоПо\уте {мо орНоп$ оЁ ргосезуте оЁ п/2 п5$ 9115 оЁ Ше теза $ оЁ 
за потби$ез оЁ 615 сотргеззште аге сопз1аегеа: 1) ив Фе изе оЁ аеуошиоп а4егз 
У\ И ргоу151оп Гог (мо 6$ оЁ ипроз1опа| сагту гот гее-орегапа аа дет; 2) Бу шсшАт? 
11$ 412145 ш Фе ю 4 сарасиу оЁ Штее-орегап4 аа4ег. Мтита| Аае]ау стгиепоп апа[уз1$ оЁ 
Фе абоуе-тепнопе4 уапап$ 15 ре {огтеа, ап изасе гесоттепдаНоп$ аге слуеп. 

УИ Шезе теап$ Фе тешфо4 асдитез Ип1$Вед сБагащег ап аПо\$ ю 4е1еп 
шиарПег$ оп Фе Ба$1$ оЁ потБиз-ПКе а44ег$ уп фе 412 еп оЁ тиарПегз п = т * 
2% уеге т=3, 4, 5, ап К 1$ |еуе] оЁ тесигу1оп, К= 1,2, .... 

Тре адуашасе$ оЁ ше те оч 15 теоШагиу оЁ Фе ши!арПег згас@ге, ап4 а]з0 изасе 
о? зуттейлс Рапсйоп аррагаз. 


Статья поступила в редакцию 31.05.2012. 


184 «Искусственный интеллект» 32012 


